Auto-rúbrica como recompensa: de preferencias implícitas a criterios generativos multimodales explícitos
<meta name=description content=Aprende a transformar preferencias implícitas en criterios generativos multimodales explícitos con auto-rúbrica. Un enfoque innovador para guiar y evaluar modelos generativos.>